AI TNT— 让一部分先用AI实现商业化

留子们在写一种很新的差评。由于全球点评打卡平台，都有个自动翻译的功能，为了防止被店家骚扰，也为了给同胞避雷，身在海外的国人们，想出各种奇招优雅给差评。

来自主题: AI资讯

2654 点击 2024-09-20 10:06

大模型做奥赛题游刃有余，简单的数数却屡屡翻车的原因找到了。

来自主题: AI技术研报

8497 点击 2024-09-04 22:03

Claude又通过「图灵测试」了？一位工程师通过多轮测试发现，Claude能够认出自画像，让网友惊掉下巴。

来自主题: AI技术研报

7877 点击 2024-09-02 16:55

前段时间，Claude 3.5帮助右手骨折工程师一周肝出3000行代码。现在，又有00后数学系本科生借助AI，用了一个月时间，在自家卧室手搓「核聚变反应堆」，震惊一大波网友。

来自主题: AI资讯

3635 点击 2024-08-26 15:56

当 ChatGPT 老早就支持使用 LaTeX 语言输入和显示数学公式时，Claude 现在终于补上了这一功能。

来自主题: AI资讯

5891 点击 2024-08-23 15:33

视觉大语言模型在最基础的视觉任务上集体「翻车」，即便是简单的图形识别都能难倒一片，或许这些最先进的VLM还没有发展出真正的视觉能力？

来自主题: AI技术研报

8069 点击 2024-07-16 19:43

最核心的Claude 3.5编码系统提示，火遍Reddit社区。就在刚刚，原作者发布了进化后的第二版，有的网友已经将其加入工作流。

来自主题: AI技术研报

7917 点击 2024-07-16 19:36

LLM能否解决「狼-山羊-卷心菜」经典过河难题？最近，菲尔兹奖得主Timothy Gowers分享了实测GPT-4o的过程，模型在最简单的题目上竟然做错了，甚至网友们发现，就连Claude 3.5也无法幸免。

来自主题: AI资讯

7844 点击 2024-07-01 12:21

想要达成通用人工智能 AGI 的终极目标，首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点，大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链（Chain-of-Thought）等技术正是由此产生的灵感。

来自主题: AI技术研报

6794 点击 2024-06-29 00:14

Claude 3.5 Sonnet的图表推理能力，比GPT-4o高出了27.8%。针对多模态大模型在图表任务上的表现，陈丹琦团队提出了新的测试基准。新Benchmark比以往更有区分度，也让一众传统测试中的高分模型暴露出了真实能力。

来自主题: AI技术研报

7898 点击 2024-06-29 00:07